1
本文作者: 趙青暉 | 2016-07-21 17:42 |
對于一個(gè)司機(jī)來說,汽車智能化最重要的一點(diǎn),就是在開車的時(shí)候不用手也能做一些駕駛以外的操作,而這一行為的實(shí)現(xiàn)多半依賴語音技術(shù)的發(fā)展。目前國內(nèi)做語音語義相關(guān)的公司也都注意到了車載領(lǐng)域的前景,紛紛針對這個(gè)領(lǐng)域做起了語音交互方案,思必馳就是其中一家。
昨天,思必馳在深圳做了一場產(chǎn)品體驗(yàn)沙龍,用他們的話來說,就是一場“裸技術(shù)分享會(huì)”,在會(huì)上向大家展示了他們最新的車載對話操作系統(tǒng)AIOS的3.0版本,通過這次技術(shù)分享,也讓大家了解了一下語音交互系統(tǒng)對車載領(lǐng)域的重要性。
在汽車駕駛環(huán)境里,因安全因素限制,駕駛員在行駛過程中能做的額外操作并不多,在傳統(tǒng)汽車中,除了駕駛操作之外,像接聽電話、娛樂等功能的操作都被集成在了方向盤中,這樣讓駕駛員手不離開方向盤就能夠完成這些事情,但是隨著“智能汽車”概念的興起,網(wǎng)絡(luò)社交、智能導(dǎo)航等功能也出現(xiàn)在了汽車中,最開始這些功能都被塞進(jìn)了車機(jī)、智能后視鏡等設(shè)備中,但是多數(shù)需要駕駛員手動(dòng)操作,這樣就為處于駕駛狀態(tài)的人帶來了非常大的不便,就此問題,人們發(fā)現(xiàn),語音操作變成了剛需。
在語音操作剛剛興起的時(shí)候,算法十分簡陋,識(shí)別率低且只能完成及其簡單的操作,這樣完全不能稱之為“智能”,在思必馳技術(shù)分析沙龍的現(xiàn)場,思必馳產(chǎn)品總監(jiān)張巖在現(xiàn)場提到了一個(gè)VUI的概念,也就是語音交互界面(Voice User Interface),這個(gè)概念說白了就是把二維的屏幕操作界面變成了由語音系統(tǒng)構(gòu)成的操作組織。
在車載領(lǐng)域,用戶操作從最初的無界面到現(xiàn)在的GUI(圖形用戶界面),正在朝VUI方向發(fā)展,這也是趨勢所在,用最有效的語音引導(dǎo)方式幫助用戶完成操作,這樣不但能夠保證駕駛的安全性、大幅度節(jié)省人力成本,還能夠?qū)⒂脩魪目菰?、繁瑣的駕乘活動(dòng)中解放出來。這種VUI理念除了在車載領(lǐng)域之外,還可與智能家居、智能機(jī)器人等領(lǐng)域的語音交互中去。
既然是交互界面,就要保證操作的準(zhǔn)確、便捷、高效,人們在下達(dá)語音命令的時(shí)候,要保證機(jī)器能夠快速的反饋和執(zhí)行,這一點(diǎn)在車載系統(tǒng)中尤為重要,因?yàn)轳{駛過程中,對智能車載系統(tǒng)的整個(gè)操作流程全都需要語音來實(shí)現(xiàn),目前來看,需求大概在以下幾點(diǎn)。
導(dǎo)航中的快捷交互:
導(dǎo)航對于車載系統(tǒng)來說是絕對核心的功能,然而目前大部分導(dǎo)航還沒能實(shí)現(xiàn)語音控制,或者只實(shí)現(xiàn)了“語音查找目的”等簡單的功能,而在VUI中,駕駛員說:“我要去XXX地方”,機(jī)器應(yīng)該立即反應(yīng)并規(guī)劃路線,告訴駕駛員距離、預(yù)估時(shí)間等信息。在整個(gè)交互中,駕駛員也可以說明訴求,比如“躲避擁堵”“最短距離”等,說出訴求后,機(jī)器也會(huì)相應(yīng)的調(diào)整路線規(guī)劃。
跨領(lǐng)域打斷:
對于“與機(jī)器對話”這件事來說,讓人最苦惱的地方無疑就是機(jī)器笨又啰嗦,比如你問它一件事情,有時(shí)候它就會(huì)叨叨叨說一大堆的話,其實(shí)在這個(gè)過程中,駕駛員可能聽到一半就能理解機(jī)器在說什么了,但通常情況下,如果機(jī)器沒有說完,是不能去執(zhí)行下一個(gè)任務(wù)的,聽一個(gè)冷冰冰的機(jī)器音啰里八嗦上一大段,確實(shí)挺讓人不耐煩的,尤其對患有路怒癥的老司機(jī)及其不友好。
采用思必馳語音方案的智能后視鏡
而思必馳在這點(diǎn)上做了改進(jìn)。在新版本的對話操作系統(tǒng)里,做了打斷功能,駕駛員在跟機(jī)器交流的時(shí)候,可以隨時(shí)打斷機(jī)器的說話,讓他去執(zhí)行其他任務(wù),這種打斷還能在導(dǎo)航、音樂、電話、微信等功能里靈活轉(zhuǎn)換,不用返回主界面,無需再次喚醒,直接進(jìn)行語音操控,讓機(jī)器做你臨時(shí)想做的事情。
合成音切換:
在機(jī)器語音這個(gè)方面,其實(shí)有個(gè)小細(xì)節(jié)值得大家關(guān)注一下。用過Siri的人都應(yīng)該了解,機(jī)器人說話大都是一個(gè)字一個(gè)字的蹦,不連貫的機(jī)器音讓人聽了想睡覺,除了標(biāo)準(zhǔn)的語音之外,做一些明星合成音,比如林志玲、郭德綱等,能夠增加不少的趣味性,思必馳活動(dòng)的現(xiàn)場,他們也為大家演示了在這方面所做的工作。
語音現(xiàn)場合成
網(wǎng)絡(luò)社交功能:
社交操作在車載領(lǐng)域的比重確實(shí)不小,而打電話發(fā)短信這種社交方式對現(xiàn)代的網(wǎng)絡(luò)社交來說,肯定是不夠用的,而司機(jī)開車時(shí)用智能手機(jī)進(jìn)行社交應(yīng)用的操作是非常危險(xiǎn)的事情,所以把網(wǎng)絡(luò)社交應(yīng)用集成到車載系統(tǒng)中,并且全權(quán)用語音進(jìn)行控制就顯得尤為重要。雷鋒網(wǎng)在思必馳技術(shù)分享會(huì)中,看到他們把微信集成到了車載系統(tǒng)中的演示,駕駛員可以在開車時(shí),直接用語音喚醒微信,并說明給誰發(fā),發(fā)什么內(nèi)容,發(fā)語音還是文字(文字是把語音轉(zhuǎn)成文字,不需要用戶手動(dòng)打字),甚至在聊天時(shí)想約見,只要對方給你發(fā)個(gè)具體位置,系統(tǒng)會(huì)自動(dòng)轉(zhuǎn)接到地圖上進(jìn)行導(dǎo)航,非常方便。
除了上述剛需和新鮮功能之外,音樂電臺(tái)等娛樂方面的語音交互、路況查詢等實(shí)用的基礎(chǔ)功能也需要在VUI中實(shí)現(xiàn),換句話說,車載語音操作要更智能,VUI就得像GUI一樣完全成熟才行。
語音交互確實(shí)是一項(xiàng)能夠提升人們操作體驗(yàn)的工具,在無人駕駛汽車正式來臨之前,語音交互絕對是能夠提升車內(nèi)操作效率和駕駛員安全系數(shù)的神器,但是這一切都在整個(gè)語音系統(tǒng)的高精準(zhǔn)、高效率的前提下的,這個(gè)領(lǐng)域目前還只處在一個(gè)不太成熟的階段,還有很大的提升空間。相信在未來的各個(gè)領(lǐng)域,特別是車載這種需要語音輔助的地方,VUI在某種程度上一定會(huì)取代手動(dòng)操作。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。